大语言模型的解耦:人工智能基础设施的下一轮进化
人工智能模型正在加速发展,但基础设施却未能跟上。随着大语言模型从客户支持到企业搜索全面赋能,传统单体式服务器架构正在成为巨大的瓶颈,而解耦(disaggregation )或许是突破之道。
人工智能模型正在加速发展,但基础设施却未能跟上。随着大语言模型从客户支持到企业搜索全面赋能,传统单体式服务器架构正在成为巨大的瓶颈,而解耦(disaggregation )或许是突破之道。
扩散语言模型(Diffusion Language Models,DLM)一直以来都令研究者颇感兴趣,因为与必须按从左到右顺序生成的自回归模型(Autoregressive, AR)不同,DLM 能实现并行生成,这在理论上可以实现更快的生成速度,也能让模型基于
游戏理解领域模型 LynkSoul VLM v1,在游戏场景中表现显著超过了包括 GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash 等一众顶尖闭源模型。
这项由北京大学马承谦领导,联合LIGHTSPEED公司陶伟以及独立研究员郭怡雯共同完成的研究发表于2025年1月,研究编号为arXiv:2507.22968v3。有兴趣深入了解的读者可以通过该编号在arXiv平台查询完整论文。这项开创性研究首次系统性地评估了语
当 2025 年世界数字教育大会在武汉落下帷幕,由教育部信标委牵头制定的《教育通用大模型标准》正式发布,而在这份规范行业发展的重要文件背后,赫然出现了畅学 AI 的名字。教育部信标委的发文中感谢了畅学 AI 的支持,畅学 AI 正以 “青少年 AI 教育小清华
网友@yspaah在墨尔本的NBA Store的门口发现了鹈鹕球星真人大小的乐高模型,动作也是锡安标志性的风车扣篮瞬间。
在近期一场关于AI大模型的讨论中,知名风险投资公司Social Capital创始人查马斯(Chamath)介绍,公司已经把大量工作需求转移到了来自中国的模型Kimi K2上,K2不仅性能强,而且比 OpenAI和Anthropic便宜太多。“Anthropi
语料库如同人工智能的“教材”,深刻影响着人工智能的政治立场、价值导向和伦理边界。作为中央重点新闻网站排头兵,人民网在人民日报编委会指导下,依托传播内容认知全国重点实验室科研能力,早在2023年初就启动了主流价值语料库的建设工作,以全领域全任务全形态覆盖的高质量
9月26日,第一届医学人工智能大会(MAIC2025)在山东济南正式召开。这场盛会主要以#医疗健康 行业“AI+”为主题,深度探讨人工智能在这一领域的应用前景。AI可谓是近几年的大热题材,随着大模型的不断成熟,AI的应用场景也在不断拓展。具体来看,以医学影像诊
像 GPT-4o、Qwen2.5-VL、SEED1.5-VL 这类端到端模型,在处理 PDF 扫描件时表现亮眼,不仅能提取文字,还能做表格分析、图表解读,甚至回答复杂问题。
核心逻辑:融合 “视觉感知、语言理解、动作生成” 三模态,实现 “看懂环境 + 听懂指令 + 做出动作” 的端到端 / 半端到端闭环;关键步骤:视觉编码:通过ViT/ResNet 等处理摄像头 / 雷达数据,提取环境特征(如车道线、障碍物);语言编码:用LLM
近日,智能座舱领军企业博泰车联与AI巨头商汤科技官宣全面战略合作,同步达成锚定投资。不同于行业多数聚焦云端大模型的合作,双方选择了更贴合汽车场景的“端侧大模型”路径,不仅要打造“芯云一体”的下一代智能座舱,更要以汽车技术赋能人形机器人,开启“AI汽车+具身智能
其中,九月下旬,阿里发布以 Qwen3-Max 为代表的全家桶产品,大秀了一把肌肉;九月末,DeepSeek 和 Anthropic 瞄准真实编程场景,先后发布了 DeepSeek V3.2-Exp 和 Claude Sonnet 4.5,此外,智谱也拿出 G
9月26日,第一届医学人工智能大会(MAIC2025)在山东济南正式召开。这场盛会主要以#医疗健康 行业“AI+”为主题,深度探讨人工智能在这一领域的应用前景。AI可谓是近几年的大热题材,随着大模型的不断成熟,AI的应用场景也在不断拓展。具体来看,以医学影像诊
10月9日,上海徐汇知春创新中心正式揭牌,字节跳动创始人张一鸣出席启动仪式并发表讲话。该机构定位为民办非企业单位,由张一鸣与上海交通大学ACM班创始人俞勇教授联合创办,专注前沿计算机和人工智能技术创新研究、开源工具和算法开发、以及顶尖创新人才培养。
AI 等新一代技术正以渗透式力量重塑社会运转的每一个维度——从日常出行的智能导航,到产业升级的数字孪生,其影响已深入生活与生产的方方面面。而当人类这一碳基生命,与AI所代表的硅基智能突破边界实现深度融合后,双方也开始解锁出新的可能。
以下是 Ling 1T 的测试数据,测试数据显示 Ling 1T 使用 4000 token 就可以实现 70.42% 的正确率,但 Gemini 2.5 Pro 需要 5000 tokens 才能达到相近效果。
近日,人民网依托传播内容认知全国重点实验室建设的“主流价值语料库”,入选国家数据局高质量数据集典型案例。10月10日,国家数据局官方微信公众号对该案例进行了专题推介。
Google近日公开预览全新AI模型Gemini 2.5 Computer Use,主打一项突破性功能:不只看得懂画面、理解需求,更能主动“动手操作UI”,像人类一样在网页或App上点击、输入与滑动。
一个只见过文本的大语言模型(LLM),在从未直接看过图像的情况下,竟然能学到可迁移到视觉任务的先验能力 —— 这是 Meta Superintelligence Labs 与牛津团队新论文的发现。